10.5 시각적 강화학습과 데이터 증강 (Data-Regularized Visual RL) 10.5 시각적 강화학습과 데이터 증강 (Data-Regularized Visual RL) 10.5.1 픽셀 입력 기반 RL(Pixel-based RL)의 표본 효율성 문제 10.5.2 DrQ(Data-regularized Q), CURL: 일관성 정규화(Consistency Regularization)와 대조 학습 10.5.3 인코더(Encoder) 학습과 정책(Policy) 학습의 분리 및 융합 전략